روش هایی جدید برای حفظ محرمانگی در داده کاوی توزیع شده

پایان نامه
چکیده

داده کاوی علمی است که به منظور استخراج دانش جدید و مفید ازمیان دادههای حجیم معرفی شد. از این رو همواره ورودی الگوریتم های داده کاوی دادههای خام می باشند، اما در همه موارد دادهها در یک مکان ذخیره نشدهاند و در موارد زیادی دادهها در بین سرویس دهندههای مختلف پخش شدهاند، این امر نیاز به همکاری چند سرویس دهنده برای انجام کاوش را ضروری می کند که نتیجه آن داده کاوی توزیع شده است. در هر کاری که صحبت از همکاری است بحث اعتماد و اطمینان نیز مطرح خواهد بود، در اینجا نیز بحث اطمینان از حفظ دادههای خصوصی افراد حقیقی و یا حقوقی از دسترس دیگران بسیار مهم است به نحوی که بحث محرمانگی و حفظ آن به عنوان مهمترین نیاز الگوریتمهای کاوش توزیع شده مطرح است. در این پژوهش هدف ارائه روش هایی برای حفاظت از داده های مورد کاوش برای کلاس بندی، در برابر دسترسی های غیر مجاز در داده کاوی توزیع شده است. برای دسترسی به هدف مورد نظر رویکرد های مختلف در این زمینه مورد مطالعه قرار گرفتند که در نهایت تمرکز ما بر روی رویکرد توزیع محاسبات و نیز رویکردهای نسل بعد یعنی روش های توزیع شده برای داده کاوی توزیع شده معطوف گشت. در ابتدا دو روش بر پایه رویکرد توزیع محاسبات ارائه دادیم که اگر چه این روش ها مشکلات روش های قبلی را رفع کرده اند اما تبدیل کاربری الگوریتم های متمرکز و استفاده به عنوان الگوریتم توزیع شده همراه با محدودیت ها و افزایش هزینه ها خواهد بود. بنابراین در ادامه الگوریتمی پایه توزیع شده و جدید که با توجه به ماهیت توزیع شده اش مشکل حفظ محرمانگی در آن به کلی حل شده است ارائه شد. این الگوریتم که k مشابه ترین نمونه ها نام گذاری شد بعد از پیاده سازی با الگوریتم معروف k نزدیک ترین همسایه ها مقایسه شده است که برای مثال از نظر صحت، نتایجی نزدیک به یک دیگر داشته اند و از نظر هزینه محاسباتی نیز، الگوریتم پیشنهادی در اجراهای توزیع شده عملکرد بسیار بهینه تری دارد.

منابع مشابه

حفظ محرمانگی داده ها در داده کاوی

داده کاوی فرآیند انتخاب، اکتشاف و مدل کردن مقدار زیاد و متنوعی از داده ها برای کشف قوانین و ارتباط بین آنها به منظور استخراج نتایج مفید برای صاحبان پایگاه داده ها است. دانش حاصل از داده کاوی موضوع جدیدی است که اخیراً در پایگاه داده ها مطرح شده است. این دانش، از اطلاعات شخصی افراد استخراج می شود. در سال های اخیر روش های داده کاوی با معضل مهم محافظت از داده های حساس، از جمله داده های بانکی، پزشکی ...

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

ارایه یک روش جدید انتشار داده‌ها با حفظ محرمانگی با هدف بهبود دقّت طبقه‌‌بندی روی داده‌های گمنام

Data collection and storage has been facilitated by the growth in electronic services, and has led to recording vast amounts of personal information in public and private organizations databases. These records often include sensitive personal information (such as income and diseases) and must be covered from others access. But in some cases, mining the data and extraction of knowledge from thes...

متن کامل

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

متن کامل

زمانبندی در محاسبات ابری ترکیبی با حفظ محرمانگی داده ها

به کار گیری فناوری ابرهای محاسباتی از بدو ابداع تا به امروز رو به رشد بوده و این روند با شتاب ادامه دارد. در این میان کلیه سازمانهای تجاری و تحقیقاتی در ابعاد بزرگ، متوسط و یا حتی کوچک خواهان این هستند که خود را با این فناوری که در مرزهای علم قرار گرفته است تطبیق دهند. استفاده از ابر خصوصی برای اجرای برنامه های جریان کاری ، کاهش هزینه و محرمانگی بیشتر اطلاعات سازمان را به دنبال خواهد داشت؛ در ح...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه امام رضا علیه السلام - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023